1
CUDA 執行模型:主機對設備
AI032Lesson 3
00:00

CUDA 執行模型將您的電腦轉換為高效率的異質系統。想像一位 總指揮官(主機/CPU) 與一群 千人部隊(設備/GPU)。總指揮官負責複雜的邏輯與決策,而千人部隊則同時執行龐大的重複性任務。

1. 結構上的差異

主機 主機 是針對延遲優化的中央處理器,專為複雜的控制流程與串列任務設計。相反地, 設備 設備是針對吞吐量優化的圖形處理器,內含數以千計的簡單核心,可同時在龐大的資料集上執行相同的指令。

2. 執行節奏

CUDA 程式運作於一系列階段中。執行從主機開始處理「串列程式碼」。當程式遇到「平行核心」時,會在設備上啟動一個 網格 的線程網格。一旦設備完成其龐大的工作負載,控制權便回歸至主機。

主機(CPU)設備(GPU)串列程式碼平行核心(線程網格)串列程式碼

3. 性能專精

此模型善用兩者的優勢:中央處理器管理系統資源與複雜分支,而圖形處理器則執行 SPMD(單一程式、多資料) 邏輯以平行方式處理資料元素。

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>